人工智能对齐(AIAlignment)指让人工智能的行为符合人的意图和价值观。人工智能系统可能会出现“不对齐”(misalign)的问题。以ChatGPT这样的问答系统为例,ChatGPT的回答可能会含有危害祖...
浏览 88 次 标签: 一分钟秒懂人工智能对齐 ( 文末送书 )